期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 面向稠密检索的伪相关反馈方法
胡文浩, 罗景, 涂新辉
《计算机应用》唯一官方网站    2023, 43 (4): 1036-1042.   DOI: 10.11772/j.issn.1001-9081.2022030480
摘要281)   HTML14)    PDF (1463KB)(106)    收藏

伪相关反馈(PRF)机制是一种自动化的查询扩展(QE)技术,它利用原始查询和初次检索中前N篇文档蕴含的信息构建更加准确的查询,从而进一步提高信息检索系统的性能。但是,现有的面向稠密检索的PRF方法由于对文本的截断处理容易造成语义信息的缺失,而且在检索阶段的空间复杂度较高。针对上述问题,提出了一种基于段落级粒度且适用于长文本稠密检索的PRF方法Dense-PRF。首先,通过计算语义距离从初次检索的前N篇文档中获得相关段落的向量;其次,对相关段落向量进行平均池化以得到QE项向量;然后,按照权重结合原始查询向量和QE项向量构建新的查询向量;最后,根据新的查询向量得到最终检索结果。在Robust04和WT2G两个经典长文本测试集上将Dense-PRF与基线模型进行了对比实验,相较于模型RepBERT+BM25,Dense-PRF在前20篇文档的准确率和归一化折现累计效益(NDCG)指标上分别提升了1.66、1.32个百分点和2.30、1.91个百分点。实验结果表明Dense-PRF能有效缓解查询与文档词汇不匹配的问题,并提升检索精度。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于朴素贝叶斯与潜在狄利克雷分布相结合的情感分析
苏莹, 张勇, 胡珀, 涂新辉
计算机应用    2016, 36 (6): 1613-1618.   DOI: 10.11772/j.issn.1001-9081.2016.06.1613
摘要591)      PDF (947KB)(697)    收藏
针对情感分析需要大量人工标注语料的难点,提出了一种面向无指导情感分析的层次性生成模型。该模型将朴素贝叶斯(NB)模型和潜在狄利克雷分布(LDA)相结合,仅仅需要合适的情感词典,不需要篇章级别和句子级别的标注信息即可同时对网络评论的篇章级别和句子级别的情感倾向进行分析。该模型假设每个句子而不是每个单词拥有一个潜在的情感变量;然后,该情感变量再以朴素贝叶斯的方式生成一系列独立的特征。在该模型中,朴素贝叶斯假设的引入使得该模型可以结合自然语言处理(NLP)相关的技术,例如依存分析、句法分析等,用以提高无指导情感分析的性能。在两个情感语料数据集上的实验结果显示,该模型能够自动推导出篇章级别和句子级别的情感极性,该模型的正确率显著优于其他无指导的方法,甚至接近部分半指导或有指导的研究方法。
参考文献 | 相关文章 | 多维度评价
3. 基于多粒度语义融合的信息检索方法
赵征宇 罗景 涂新辉
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2023050646
预出版日期: 2024-01-03